تجارت الکترونیک - • آيا متن كاوي همان جستجو بر روي متن نيست؟ چرا؟ - اصطلاحات olap

    • • آيا متن كاوي همان جستجو بر روي متن نيست؟ چرا؟ - اصطلاحات olap
    • خیر. در جستجو در متن به دنبال کلمات می گردیم ، اما متن کاوی به این محدود نیست بلکه علاوه بر جستجوی کلمات پردازش هایی بر روی این کلمات انجام می شود تا بتوان با استفاده از نتیجه بدست آمده در تصمیمات از این نتایج استفاده نمود .

       

      Corpus : مجموعه ای از زبان های نوشته شده و صحبت شده که بر روی کامپیوتر ذخیره می شود و مورد استفاده برای تحقیق زبان و نوشتن لغت نامه ها می باشد

       

      Concepts : استخراج مفهوم فعالیت های که منجر به استخراج مفاهیم از مصنوعات است.

       

      Stemming : روند کاهش کلمات صرف شده (و یا گاهی اوقات مشتق شده است)به ساقه، پایه یا ریشه فرم به طور کلی فرم کلمه نوشته شده است

       

      Terms & Term dictionary : لغاتی که از قبل ذخیره شده و هنگام متن کاوی این لغات درون نوشته ایندکس می شود تا در ماتریس مربوطه قرار گیرند

       

      Stop words : در محاسبات، توقف کلمات ،کلماتی هستند که از قبل ، یا بعد از ، پردازش داده ها زبان طبیعی فیلتر شده

       

      Synonyms : کلمات مشابه در معنی

       

      Tokenizing : فرایند شکستن یک جریان متن به کلمات، عبارات، نمادها، و یا دیگر عناصر معنی دار به نام نشانه ها

       

      Word frequency : تعداد تکرار کلمه در متن

       

      Part-of-speech tagging : نشانه گذاری بخشی از گفتار

       

      Singular value decomposition: در جبر خطی، تجزیه مقدار منفرد (SVD) فاکتور یک ماتریس حقیقی یا پیچیده است، با بسیاری از برنامه های کاربردی مفید در پردازش سیگنال و آمار.

       

      Term-by-document matrix: یک ماتریس ریاضی که توصیف فراوانی از شرایط رخ داده در مجموعه ای از اسناد است.